DeepSeek R1
DeepSeek 2025-01-20 发布的开源推理专精大模型(与 OpenAI o1 / o3 同档),671B MoE 架构基于 DeepSeek V3 通过强化学习训练而成,是 2025-01 "DeepSeek 时刻"的引爆芯片,引发全球大模型推理范式重定价。
关键规格
| 维度 | 数值 |
|---|---|
| 发布 | 2025-01-20 |
| 参数 | 671B 总 / 37B 激活(基于 V3) |
| 上下文 | 128K tokens |
| 训练方法 | 纯 RL(R1-Zero)+ 监督微调(R1) |
| 模态 | 文本 |
| 许可证 | MIT 完全开源 |
| 蒸馏小模型 | R1-Distill-Llama-70B / R1-Distill-Qwen-32B 等 |
市场定位
R1 战略意义:
- 首款开源对标 o1 的推理模型 —— 性能在 AIME / MATH / Codeforces 等评测追平 o1
- 完全开源 + 论文公开 —— 算法细节(GRPO、self-play RL)全部公开
- 蒸馏小模型 —— 释放多个 7B / 32B / 70B 蒸馏版,企业可低成本部署
- DeepSeek 时刻 —— 2025-01 引发 NVIDIA 暴跌 + 全球算力需求重估
- 推动 OpenAI / Anthropic 把推理模型纳入主力(GPT-5 统一思路、Claude 4 Extended Thinking)
客户与部署
- API —— DeepSeek 官方 API(价格仅 $0.55/M input, $2.19/M output,远低于 o1)
- 企业自部署 —— 多家公司基于 R1 二次训练
- 云服务 —— 各大云厂商第一时间上架(Together AI, Fireworks, AWS Bedrock 等)
演进路线
DeepSeek V3 → R1-Zero(纯 RL 训练)→ R1(SFT + RL)→ 蒸馏小模型多版 → 集成入 DeepSeek V4(路线图统一)
关联
↑ up::DeepSeek 幻方量化 DeepSeek V3 ↓ down::4-04-模型部署与优化 5-04-AI编程助手 ⚔ competitor::GPT-5 Claude Opus 4 ∈ belongs_to::4-02-模型工厂